VMware ESX
用于整合系统的虚拟主机的软件
VMware ESX 服务器是在通用环境下分区和整合系统的虚拟主机软件。它是具有高级资源管理功能高效,灵活的虚拟主机平台。
用途
完美匹配企业数据中心,通过提高资源使用率,扩展计算机性能和优化服务器, VMware ESX 服务器帮助企业降低计算机基础构架的成本。VMware ESX 服务器能实现:
·服务器整合
VMware ESX 服务器能在更少的高伸缩和高可靠企业级服务器上,包括刀片式服务器,整合运行在不同操作系统上的应用程序和基本服务
·提供高性能并担保服务品质
ESX 服务器支持出于开发和测试为目的,在同一系统内的虚拟主机集群;同样也高性能的支持系统间的虚拟主机集群。VMware ESX 服务器担保服务器的CPU,内存,网络带宽和磁盘 I/O 处于最优化的状态,改进对内和对外的服务
·流水式测试和部署
VMware ESX 服务器压缩虚拟主机镜像以便它们在环境间能被非常容易的迁移,确保软件测试者和质量检验工程师在相对少的时间和硬件状态下做更多有效的测试
·可伸缩的软硬件构架
VMware ESX 服务器包含支持 VMware Virtual SMP,确保企业在灵活,安全和轻便的虚拟主机上运行所有重要的应用程序。
运作
VMware ESX服务器传输物理系统到逻辑资源池,系统和应用程序被分离在包含多虚拟机的单一硬件片上。系统资源按需动态分配到任何操作系统上,提供大型机的性能和服务器资源控制。VMware ESX 服务器通过在安全便捷的虚拟机上执行分区和分割服务器资源来简化服务器的基础构架。VMware ESX 服务器确保服务器资源能被远程管理,自动预制和标准化。高级资源管理控制通过企业担保服务质量。
直接运行在系统硬件上的 VMware ESX 服务器为部署,管理和远程控制多虚拟机提供了一个安全,唯一的平台。有了VMware ESX服务器:
·特定系统的应用程序能被迁移到在更可靠和可伸缩的不同虚拟机上去。
·服务器能从任何地方被远程管理,简化服务器维护。
·通过高级资源管理控制,服务质量能得到保证。
·普通的监控和管理任务是自动脚本式的。
·无须添加新的物理系统,性能得到明显提升。
常见问题
Windows服务器的管理员早已熟悉了可怕的蓝屏死机(BSOD),这就意味着服务器完全地终止。VMware ESX也有类似的状况,叫做紫屏死机(PSOD),典型的是由于硬件问题和VMware 代码中的bug造成的。
1、紫屏死机问题
当一个PSOD出现时,你需要做的第一件事情就是记录下屏幕上显示的信息,我建议用数码相机或者手机拍一个快照。PSOD信息包括ESX的版本和构建、异常类型、寄存器转储、在崩溃时每一个CPU在运行什么、跟踪信息、服务器正常运行时间、错误信息和内存核心转储信息。这些信息对你没用,但是VMware 技术支持人员可以解码上述信息,帮助测定崩溃的原因。
不幸的是,当遭遇到PSOD,除了记录屏幕上的信息,你唯一的选择是关闭服务器重启。一旦服务器重启起来,你将在服务器的/root目枷路⑾謒kernel-zdump-*文件,这个文件对定位问题很有价值。你可以用vmkdump工具从该文件中提取vmkernel日志文件(vmkdump –l),然后定位引起PSOD的原因。VMware支持一般也需要这个文件。出现PSOD常见的原因是服务器内存不足,那个转储文件将有助于识别导致问题的内存模块并替换这个模块。
2、检查你的RAM
如果你怀疑你系统的RAM可能有问题,可以用一个内置的工具在后台检查你的RAM而不影响你正在运行的虚拟机。该RAM检查工具运行在VMkernel里,通过登录到服务器控制台,输入Service Ramcheck Start开启。
当正在运行RAM检测时,它把所有的活动和任何错误信息记录到/var/log/vmware目录下的文件ramcheck.log和ramcheck-err.log中。然而,它的一个缺陷是如果你有虚拟机正在运行,用这个工具不能检测所有的RAM,只能检测在ESX系统中未用的RAM。一个比较彻底的检测你的服务器中RAM的方法是关闭ESX,从CD引导,然后运行Memtest86+程序。
3、使用vm-support工具
如果你联系VMware技术支持人员,他们一般会要求你运行vm-support工具,它将把所有的ESX server的日志和配置文件打包成一个文件。通过root权限
4、用日志文件排除故障
日志文件一般是排除各种类型问题的最好工具。ESX有许多的日志文件,你需要检查哪个日志文件取决于你所遇到的问题。以下是ESX日志文件的列表,你通常可以用来定位ESX服务器的问题。VMkernel和主机日志文件一般都是你需要首先检查的。
VMkernel - /var/log/vmkernel——与虚拟机和ESX服务器相关的活动的记录。带扩展名以数字循环,当前的日志没有扩展,最近的日志带有“.1”扩展。
VMkernel Warnings -/var/log/vmkwarning——记录虚拟机的活动,VMkernel日志的子集,用同样的循环模式。
VMkernel Summary - /var/log/vmksummary——用于确定ESX服务器正常运行的时间和可用性统计,可读性的总结在/var/log/vmksummary.txt中。
ESX Server host agent log - /var/log/vmware/hostd.log——包含管理和配置ESX服务器主机和它的虚拟机代理信息。(查找文件的date/time戳来找到最近输出的日志文件,或者打开hostd.log,该文件连接到当前的日志文件)。
ESX Firewall log - /var/log/vmware/esxcfg-firewall.log——记录所有的防火墙规则事件。
ESX Update log - /var/log/vmware/esxupdate.log——记录所有的通过esxupdate统计所在的更新。
Service Console - /var/log/messages——包括所有的用于排除虚拟机和ESX服务器故障的一般日志信息。
Web Access - /var/log/vmware/webAccess——记录通过基于web访问ESX服务器的信息。
Authentication log - /var/log/secure——包含所有的需要认证的连接信息,例如VMware守护进程和由xinetd守护进程发起的动作。
Vpxa log - /var/log/vmware/vpx——记录和VirtualCenter通讯的代理的信息,通过查找文件的date/time戳来找到最近输出的文件或者打开hostd.log,该文件连接到当前的日志文件。
做为解决故障过程的一部分,你经常需要找出各种ESX组件的版本和使用的补丁,下面是一些命令,你可以从服务台运行来完成:
输入vmware -v来检查ESX服务器的版本,例如VMware ESX Server 3.0.1 build-32039
输入esxupdate –l query来查看安装的补丁
输入vpxa –v来检查ESX服务器的管理版本,例如VMware VirtualCenter Agent Daemon 2.0.1 build-40644
输入rpm –qa | grep VMware-esx-tools来检查ESX服务器VMware Tools安装的版本,例如VMware-esx-tools-3.0.1-32039
如果所有可能失败,重启Vmwate主机代理服务
许多的ESX问题可以通过重启VMware主机代理服务(vmware-hostd)解决,该服务负责管理大部分ESX主机的操作,通过登陆服务控制台,输入service mgmt-vmware restart来实现。
注意:ESX 3.0.1有一个bug,如果你的ESX服务器为你的VM配置了auto-startups选项,它将重启你所有的VM。这个bug在3.0.1 和 3.0.2中用一个补丁修复,但是在ESX 3.5中用另一个发布的补丁修复。在运行此命令时最好临时禁止auto-startups选项。
在某些情况下,当你重启主机代理服务,重启vmware-vpxa服务可以定位发生在ESX和VI Client之间以及ESX和VirtualCenter之间的问题。该服务是管理代理,处理ESX和它的客户端的所有通讯。通过登陆ESX主机,输入service vmware-vpxa restart就可以完成。需要注意的是重启哪种服务都不会影响你的虚拟机操作(除了上述提到的bug)。
VMware ESX服务器常见问题之修复冻结的服务控制台
另一个会发生的问题是你的服务控制台挂起,不允许你本地登入。硬件锁定或者一个死锁状态都会导致这样。当发生这种状况时,你的VM可以继续正常运行,但是重启ESX是通常恢复的唯一的方法。在你重启之前,试着关闭你的客户VM,或者用VMotion把它们迁移到另一个ESX主机上。通过SSH远程连接的VI Client或者alternate/emergency控制台的其中之一来完成,可以先按Alt-F6,然后按Alt-F2键。你也可以按Alt-F12在控制台的屏幕上显示内核信息。如果你可以关闭或者迁移你的VM,你就可以通过VI Client或者alternate控制台发出重新引导的命令来试图重启服务器。如果不行,冷启动服务器就是你唯一的选择了。
5、网络配置丢失
可能出现的问题是你也许丢失了部分或所有的网络配置。如果发生这种情况,由于你不能通过VI Client连接,你必须用ESX本地服务控制台来重新构建网络。VMware已经发布了相关知识的文章:如何使用esxcfg-*服务控制台命令来重建你的网络和如何验证你的网络配置。
网络配置
VMware ESX虚拟服务器网络有一些特殊的考虑。下面将逐一介绍需考虑的基于物理服务器的配置选择、VLAN标记、MAC地址和系统管理等。
机架和刀片服务器的基本网络
VMware ESX Server为优化配置和虚拟网络架构提供了灵活性,满足了多种不同的需求。但是,配置的灵活性可能会是一把双刃剑,因为VMware的基本网络架构提供了如此之多的选择,可能反倒容易令人困惑。所以,为了优化ESX网络,网络管理员应该先熟悉VMware在刀片和机架服务器上的基本网络选择。
塔式和机架服务器需要至少五个网络适配器。因为刀片服务器和底盘(chassis)从底盘到分布式/核心交换机的uplink端口数量有限,网络管理员应该从高阶积架式交换器(Chassis Switch)配置uplink端口的链路聚集(Trunking),并且实施802.1q VLAN标记,网络至少为每秒1GB。
系统管理员可以使用多个以太网端口配置ESX。活跃(Active)或备用(Standby)的配置都应该采用,以防主要的端口发生故障。同时,网络管理员应该采用多个负载平衡配置组合端口配置,这将基于源端口IT、源MAC地址的散列值以及来源和目标地基于IP的散列值。
观察网络故障,监控适配器的连接状态,以及利用信标(Beaconing)查找网络上游的问题。同样,可以对端口进行配置,来通知网络中的交换机某个端口已经重新配置,因此ARP表格进行更新,这样可以最小化其他的错误。
VMware VI3下配置和实行VLAN
VLAN(虚拟LAN)并不是什么新概念,多数网络架构师和管理员都了解在传统基础设施中配置VLAN的方方面面。但是,使用VMware VI3配置VLAN却不尽相同。没有虚拟化的工作过程和有虚拟化的工作过程是不一样的。所以,在设置VLAN之前,网络管理员需要了解一下事项:
需要多少个物理NIC
一个台新的虚拟服务器把哪一个VLAN叫做home
VLAN如何工作
多数VMware专家谈到在VMware Infrastructure(VI3)中使用虚拟LAN(VLAN)时,他们通常是指VLAN Trunk的使用。不过,VI3使用的VLAN配置还有其他三种类型:Virtual Switch Tagging(虚拟交换机标记,缩写VST )、External Switch Tagging(外部交换机标记,缩写EST)和Virtual Guest Tagging(虚拟guest标记,简称VGT)。VLAN标记允许把一个VLAN直接连接到一个子虚拟机。管理员应该对什么是VST、EST和VGT以及如何使用进行了解。
对于子虚拟机而言,VST通常是最佳的选择,但要取决于具体的业务需求。VST使用VLAN Trunk。物理交换机把ESX Server的交换机当作一台物理交换机看待,在跨Trunk传递通信到服务器NIC的过程中,对通信进行相应的标记。然后ESX Server利用标记引导通信到其端口。
如果组织内的服务器是插入到分布式层的交换机,交换机连接到一个核心交换机,那么EST或VGT可能更加适合。在这种情况下使用VST标记就几乎不可能。你可能需要使用EST标记。
此外,如果某一个具体的虚拟机需要同时在多个VLAN上的话,VGT就更加合理。你将需要子操作系统支持VLAN驱动,这种情况在Unix和Unix相似的操作系统很常见,如Solaris、OpenBSD和某些Linux分布系统。
网络冗余性
至少要两个接口分配到ESX服务控制端口。如果你只分配了一个接口,VirtualCenter 2.5会警告你。但VirtualCenter之前的版本不会。
VirtualCenter2.5的错误信息将会造成集群显示器错误标志出现,可能从找不到的连接ESX 3.01和3.02主机的接口发出,更有可能是3.5主机。这一点很重要,因为如果你的虚拟服务器碰到一个新的或额外的错误,你可能不会立刻注意到。为了解决这个问题,在不需要冗余性的虚拟机网络使用一个集合的vSwitch,将它在网络和VirtualCenter中重新进行配置,与服务控制端口位于同一个网络。
断开的网络适配器
如果你使用ESX进行物理到虚拟的迁移,要知道你可以配置虚拟服务器,让网络适配器在启机时就断开。你将能够从子操作系统看到硬件的清单,但是它显示好像网络断开了。使用一台不连网的虚拟机,虽然你无法测试IP 地址,但你可以配置你的IP寻址和DNS信息。
这个选项很有用,因为在某些情况下,在网络上具有一个后备的虚拟机,并运行预设的任务可能会产生各种错误,例如, IP地址重复,虚拟机应用程序与另一台运行的系统同时获取数据,业务系统更新的版本传送到其他系统产生的格式问题等等。
ESX的网络提供了很大的灵活性,但是灵活性也为错误留有空间。通过本文以及文章中的对其他文章链接 ,你应该可以很好地理解如何以及为什么为你的虚拟服务器进行网络配置,对冗余性、速度及可用性进行优化,以满足你计算环境的具体需求。
参考资料
VMware ESX的网络配置及考虑.TechTarget虚拟化.2008-05-21
最新修订时间:2022-10-05 21:01
目录
概述
用途
参考资料